1
Xác định Mối quan hệ thông qua Phân phối Điều kiện
MATH003Lesson 10
00:00
Chào mừng bạn đến với một sự thay đổi tư duy trong thống kê. Chúng ta đang đi xa hơn khỏi trực giác đơn giản về "đường xu hướng" để tiến tới một nền tảng nghiêm ngặt hơn Khung Khái niệm Phân phối. Ở đây, chúng ta xác định mối quan hệ không chỉ dựa trên hệ số tương quan, mà còn là bất kỳ sự thay đổi nào trong hành vi xác suất của biến phản hồi $Y$ khi biến dự đoán $X$ thay đổi.

Định nghĩa 10.1.1: Liên kết Thống kê

Hai biến $X$ và $Y$ được xem là có liên quan nếu có bất kỳ sự thay đổi trong phân phối điều kiện của $Y$, khi biết $X = x$, khi $x$ thay đổi. Ngược lại, trạng thái "không có mối quan hệ" là tương đương toán học với tính độc lập của $X$ và $Y$.

Tính tương đương Lôgic

Các biến $X$ và $Y$ không liên quan nếu và chỉ nếu $f(y|x) = f(y)$ với mọi giá trị của $x$. Điều này ngụ ý rằng hàm tần suất tương đối đồng thời có thể được phân tích thành:

$$f(x, y) = f(x)f(y)$$

Do đó, kiểm tra mối quan hệ về cơ bản là một phép thử về Tính độc lập.

Cơ chế Thay đổi

Một mối quan hệ được xác định bởi bất kỳ sự dịch chuyển nào trong hàm mật độ điều kiện (như minh họa trong Hình 10.1.1). Điều này bao gồm:

  • Dịch chuyển Trung bình: Giá trị kỳ vọng $E(Y|X)$ thay đổi (điểm tập trung phổ biến nhất).
  • Dịch chuyển Phương sai: Độ rộng hoặc mức độ bất định của $Y$ phụ thuộc vào $X$ (phương sai thay đổi).
  • Thay đổi Dạng hình: Phân phối tổng thể thay đổi (ví dụ: từ đối xứng sang lệch).

Thiết lập Nguyên nhân - Kết quả thông qua Thiết kế

Một mối quan hệ thống kê không ngụ ý nguyên nhân - kết quả. Để khẳng định rằng $X$ gây ra $Y$, chúng ta phải xem xét các biến gây nhiễu thông qua Thiết kế Thực nghiệm:

  • Các nhóm Kiểm soát: Cung cấp một chuẩn mực để so sánh.
  • Hiệu ứng Nước cờ: Giảm thiểu cảm giác cải thiện nhờ các phương pháp vô hiệu.
  • Che giấu thông tin: Sử dụng các thí nghiệm mù (người nhận không biết) và các thí nghiệm hai chiều mù (cả người nhận và nhà nghiên cứu đều không biết) để loại bỏ thiên vị.
  • Bố trí khối: Như đã thấy trong Ví dụ 10.1.7, chúng ta sử dụng các biến khối ($W$, ví dụ như độ phì nhiêu của đất) để đảm bảo mối quan hệ giữa loại lúa mì ($X$) và năng suất ($Y$) không bị ảnh hưởng bởi các điều kiện sẵn có.
🎯 Ước lượng Toán học Cốt lõi
Chúng ta ước lượng những mối liên kết này bằng cách sử dụng Hàm khả năng điều kiện hàm số. Đối với dữ liệu rời rạc có các tần số $f_{ij}$:
$$L = \prod_{i=1}^a \prod_{j=1}^b (\theta_{j|X=i})^{f_{ij}}$$ Độ lệch chuẩn: $SE = \sqrt{\frac{\hat{\theta}_{ij}(1 - \hat{\theta}_{ij})}{n}}$